
# Aufgabe 2.1

# Daten 
a<-   c(rep(1,5), rep(2,9), rep(3,13), rep(4,3), 6)
b<-   c(rep(1,3), rep(2,6), rep(3,10), rep(4,2), 5, rep(6,2))
ay<-  as.numeric(names(table(a))); ay
fna<- ecdf(a) # empirische Verteilungsfunktion zur Stichprobe a
az<-  fna(ay) # Werte der empirische Verteilungsfunktion in ay
az
#          1         2         3         4         6
#  0.1612903 0.4516129 0.8709677 0.9677419 1.0000000
names(az)<- names(table(a))

round(az, 2) # empirische Verteilungsfunktion von A
#     1    2    3    4    6 
#  0.16 0.45 0.87 0.97 1.00 

by<-  as.numeric(names(table(b))); by
fnb<- ecdf(b) # empirische Verteilungsfunktion zur Stichprobe b
bz<-  fnb(by) # Werte der empirische Verteilungsfunktion in by
names(bz)<- names(table(b))

round(bz, 2) # empirische Verteilungsfunktion von B
#     1    2    3    4    5    6 
#   0.12 0.38 0.79 0.88 0.92 1.00

l<- list("empirische Verteilungsfunktion zur Stichprobe A",round(az,2), 
         "empirische Verteilungsfunktion zur Stichprobe B",round(bz,2)); l

par(mfrow= c(2,2))
hist(a, br=20, main="Zensuren A", xlab="Note", ylab="Anzahl")
hist(b, br=20, main="Zensuren B", xlab="Note", ylab="Anzahl")

plot(ecdf(a), main="Empirische Verteilungsfunktion von A")
plot(ecdf(b), main="Empirische Verteilungsfunktion von B")

# Aufgabe c)
# Die Spaltenzahl der Matrizen fna(ay) und fnb(by) ist verschieden, weil in a die Note 5 fehlt.
# Hier muss man also Klimmzuege machen, etwa in einem Vektor azz die
# Verteilungsfunktion an der Stelle 5 ergaenzen:

azz<- c( 0.1612903, 0.4516129, 0.8709677, 0.9677419, 0.9677419, 1.0)
bzz<- as.numeric(bz);
d<-   max(abs(azz- bzz)); d
# d= 0.09274194

# Der Vergleich funktioniert, wenn man fuer die "Namen" in den Verteilungsfunktionen 
# den gleichen Vektor "by" verwendet:
d<- max(abs(fna(by)- fnb(by))); d

# Diese Teilaufgabe ist ein Vorgriff auf den Kolmogorov-Smirnov-Test:
ks.test(a,b)

 *********************************************************************

beim URZ gibt es (eventuell) ein Softwaerehandbuch unter

http://www.uni-leipzig.de/~boesze/softwarehandbuecher.php

zu ''Statistik mit R'' für 4.90 EUR

siehe auch:
http://www.rrzn.uni-hannover.de/buch.html?&no_cache=1&titel=statistik_r
